67 research outputs found
La phrase verbale noyau en français
La phrase verbale noyau en français, caractérisée comme la chaîne de mots qui comprend clitiques, auxiliaire, noyau verbal, particules de négation, l'adverbe toujours et la forme tous est étudiée dans un cadre -- libellé 5P -- qui essaye d'intégrer observation, test et calcul -- c'est-à -dire les activités essentielles de toute science du réel -- dans l'étude des phénomènes linguistiques. Le cadre 5P est présenté dans ses caractéristiques essentielles. Les Propriétés permettant de spécifier, sous certaines conditions d'observation, les phrases verbales noyau sont définies, de même que le calcul à effectuer pour générer tous les conséquences de ces Propriétés -- c'est-à -dire les suites qui sont des phrases verbales noyau en français. On montre, par ailleurs, les possibilités de calcul à partir de ces suites. Les caractéristiques de modularité et d'incrémentalité du système sont illustrées, et celui-ci est mis en perspective par rapport à d'autres points de vue qui ont cours en linguistique
Propriétés et analyse d'un langage
International audienceNous présentons dans cet article une nouvelle approche, que nous appelons 5P, permettant la description des propriétés d'un langage et son utilisation pour une analyse automatique. Nous montrons comment cette approche permet la prise en compte de la dimension descriptive de la linguistique. Par ailleurs, nous présentons une technique d'analyse, appelée analyse par Filtrage et Fusion, qui tire parti de cette description en propriétés. Nous montrons en quoi ces deux projets (description d'une langue et analyse automatique) convergent et ouvrent de nouvelles perspectives
French Order Without Order
International audienceTo account for the semi-free word order of French, Unification Categorial Grammar is extended in two ways. First, verbal valencies are contained in a set rather than in a list. Second, type-raised NP's are described as two-sided functors. The new framework does not overgenerate, i.e. it accepts all and only the sentences which are grammatical. This follows partly from the elimination of false lexical ambiguities -- i.e. ambiguities introduced in order to account for all the possible positions a word can be in within a sentence -- and partly from a system of features constraining the possible combinations
Les tables de Méthodes en syntaxe : introduction à un mode d’emploi
L’analyse des tables de Méthodes en syntaxe (Gross, 1975) révèle que celles-ci sont formellement ininterprétables. La méthodologie pour aboutir à une version formalisée est présentée avec un fragment qui l’illustre. Cette version permet d’une part d’extraire les informations au moyen d’un procédé mécanique et d’autre part d’en évaluer les limites. La théorie sous-jacente est caractérisée en dégageant quelques questions essentielles qui doivent être réglées par toute base de données lexicales, et en particulier, celles qui concernent le rapport de la syntaxe avec la sémantique.The analysis of the tables of Méthodes en syntaxe (Gross, 1975) reveals that they cannot be formally interpretable. The methodology to obtain a formalised version is presented together with a fragment which illustrates it. This version allows on the one hand the extraction of the information using a mechanical procedure and, on the other hand, the evaluation of this information. The underlying theory is characterised with the specification of some fundamental questions, particularly those relating to the mapping of syntax with semantics, to which answers must be provided by any lexical data base
Les structures syntaxiques du langage Vercingétorix I. Problèmes liés à leur naturalité.
International audienceLe langage documentaire VercingĂ©torix 1 (V1) est un outil pour la recherche documentaire, destinĂ© Ă ĂŞtre utilisĂ© par le documentaliste indexeur pour produire des indexations et les questions documenÂtaires. Pour satisfaire diverses exigences, on a fait, dans la formulation de V1, le choix de la naturalitĂ©. Ce texte attire l'attention sur les dĂ©savantages de cette naturalitĂ© avec deux objectifs de fond : a) apporter des Ă©lĂ©ments pour un bilan critique de V1 sur le plan technologique et b) dĂ©gager les caractĂ©ristiques des langues naturelles susceptibles d'expliquer ce bilan. La discussion s'articule autour des notions de paraphrase et ambiguĂŻtĂ©, caractĂ©ristiques des langues naturelles et sur les compromis Ă faire dans le langage V1 (ajout ou non de règles d'utilisation susceptibles de complexifier excessivement le système)
Description phonologique et codification Ă©conomique du langage
International audiencePour transmettre et/ou stocker un texte en langue naturelle, chaque symbole de son signifiant est codifié par une suite de symboles binaires. Dans le cadre de la codification économique du langage, on se propose de réduire autant que possible le nombre de symboles binaires utilisés tout en sauvegardant l’univocité de la codification et de la décodification. Ce texte présente le Code de réduction alphabétique C, où les symboles sont organisés en une pluralité de systèmes en fonction de leurs contextes d’apparition. Un tel code témoigne à la fois d’une manière d’explorer les caractéristiques structurelles des langues naturelles productrices de redondance et de la possibilité d’apporter une réponse, à partir des caractères propres aux langues naturelles, au problème de la condensation de l’information
Cliticos en frances y modelos linguisticos
International audienceGSG (Gramática Sintagmática Generalizada), modelo lingĂĽĂstico cuyas pautas de base fueron propuestas por Gerald Gazdar, es una alternativa rigurosa y elegante a los modelos chomskyanos. En el trabajo se resumen las principales caracterĂsticas de GSG y se muestra cĂłmo, en francĂ©s, es posible tratar con un modelo de gramática formalmente simple, fenĂłmenos como el de los clĂticos y las topicalizaciones que en la tradiciĂłn chomskyana requieren Ăştiles formales más poderosos y menos conocidos. Finalmente, se pone en relaciĂłn la cuestiĂłn descriptiva con el problema general de la selecciĂłn de modelos lingĂĽĂsticos alternativos
La linguistique entre science et ingénierie
International audienceAn analytical grid is proposed in order to epistemologically characterize studies concerning the formalization and/or computational processing of natural languages. The grid concernes the three basic elements of an empirical science: the domains of observations, of hypotheses and of the corroboration test. In the first domain, the basic objects are expressions, i.e. sequences of codes on magnetic support, and the Observer. Hypotheses are analyzed in terms of the possibility of calculating on them, and of linguistically extending or porting them. The corroboration test confronts hypotheses and observations. Reference works of the textalgorithmic and of the symbolic approaches in language studies are analyzed with respect to the proposed grid. Some perspectives are proposed from elements of a partial evaluation of the two approaches.Une grille d'analyse est proposée pour caractériser sur le plan épistémologique des travaux relevant de la formalisation ou du traitement informatique des langues. Elle porte sur les trois éléments-clés d'une science de l'empirie : le domaine des observations, des hypothèses et du test de corroboration. Dans le premier, on se donne comme objet de base des expressions, suites de codes sur support magnétique, et l'Observateur. Les hypothèses sont analysées selon leurs possibilités de calcul, d'extension et de portabilité linguistiques, et selon leurs visées descriptives ou explicatives. Le test de corroboration les confronte avec les observations. Des travaux qui font référence dans l'approche texto-algorithmique et dans l'approche symbolique sont analysés selon cette grille. Des perspectives sont proposées à partir d'éléments d'une évaluation provisoire des deux approches
An Evaluation of Inter-Annotator Agreement in the Observation of Anaphoric and Referential Relations
International audienceWhen proposing a description of the data he observes, the linguist must make sure that his observations may be also regularly made by other persons. In this paper, we introduce a typology of anaphoric and referential relations and an experiment which aims at assessing that this typology is operational. Given three newspaper articles, five students were asked to identify anaphoric and/or referential relations between expressions and referents. This inter-subjectivity test confirms results already obtained: coreference is an operational notion, but the perspicuity of other relations is not obvious
Conocimiento de la lengua y tĂ©cnicas estadĂsticas en el análisis lingĂĽĂstico
International audienceSon comparados los resultados obtenidos sobre un mismo corpus en la tarea del POS tagging por dos sistemas orientados por enfoques diferentes en lingĂĽĂstica computacional, el uno orientado por el Conocimiento de la lengua (sistema CL) y el otro por TĂ©cnicas estadĂsticas (sistema EST). Se trata de no limitarse a consideraciones globales sobre el « costo » de obtenciĂłn de los dos tipos de resultados, nociĂłn mal definida, ni a cotejar resultados globales, sino de poner en relaciĂłn los resultados obtenidos con las caracterĂsticas lingĂĽĂsticas involucradas. La problemática de la comparaciĂłn es clarificada, los sistemas CL y EST presentados, la metodologĂa de la comparaciĂłn definida y los resultados obtenidos presentados. En el caso comparado, el sistema CL ofrece mejores resultados, pero la conclusiĂłn más interesante es la posibilidad de establecer correlaciones entre aspectos de la estructura lingĂĽĂstica y resultados obtenidos por tĂ©cnicas estadĂsticas
- …